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Предложена методика последовательного синтеза оптимальных управлений в линейных и нелинейных системах при ограничении координат, 
основанная на многократном численном решении дифференциальных уравнений, методах динамического программирования и имитационного 
моделирования, принципах “перемены цели” и “ведущего слабого звена”. Оптимальный по быстродействию закон управления системой 
составляется из управлений, найденных для малых шагов во время переходного процесса. 


Введение 

Синтез оптимальных управлений в системах с 
ограничением координат традиционными методами не 
всегда возможен. Трудности возникают в случае изме- 
нения возмущающих воздействий и заданий во время 
переходных процессов. Продвижение к глобальной 
цели обычно осуществляется за счет соответствующей 
координации действий подсистем. Глобальная цель 
развертывается в подцели, причем, часто лишь после 
достижения подцели появляется возможность оценить 
целесообразность принятия того или иного закона 
управления. Метод динамического программирования 
позволяет решать задачи, которые не решаются клас- 
сическими методами вариационного исчисления путем 
прямой оптимизации исходного функционала, однако 
и с его помощью не всегда удается оптимизировать 
управление в нелинейных системах. 


Оптимизация законов управления технологически- 
ми процессами в реальном масштабе времени микро- 
процессорными средствами с учетом нелинейностей и 
ограничений фазовых координат требует разработки 
простых алгоритмов, способных обеспечить качествен- 
ный синтез дискретных управляющих воздействий. Для 
этих целей следует применять новые нестандартные 
подходы, в которых требуется не столько искусство ма- 
тематика, сколько хорошее знание рассматриваемой тех- 
нической задачи и понимание того, какими факторами 
можно пренебречь и к каким последствиям это приведет. 
Создание таких алгоритмов оптимального управления 
возможно с применением элементов логики, системного 
анализа и метода избыточных переменных. 

1. Методика последовательного многошагового синтеза опти- 
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мальных управлений 

Во всяком действии легко увидеть его составные 
части, более мелкие действия. Они должны выпол- 
няться не в произвольном порядке, а в определенной 
последовательности. В сложных системах наблюдается 
иерархическая система противоречий, которую можно 
использовать. В настоящее время широко применяется 
для анализа структур сложных процессов и систем ими- 
тационное моделирование, которое позволяет постичь 
суть явления, не прибегая к экспериментам на реальном 
объекте. На имитационных моделях возможен поиск 
оптимальных управлений путем исследования процес- 
сов, получаемых в результате приложения пробных 
управляющих воздействий. Новые методики синтеза 
оптимальных управлений могут быть созданы на ос- 
нове методов динамического программирования [1] и 
имитационного моделирования, принципов “перемены 
цели” и “ведущего слабого звена”. 

Принцип “перемены цели” служит в качестве средс- 
тва приспособления системы к изменению параметров, 
фазовых координат, ограничений и требований к пере- 
ходным процессам. Принцип “ведущего слабого звена” 
подразумевает объединение слабых и сильных звеньев 
для достижения цели. В течение переходного процесса 
главными на разных этапах становятся разные ограни- 
чения и требования, причем, некоторые ограничения 
могут и не стать главными для конкретного процесса и 
не участвовать в формировании оптимального управ- 
ления. Наличие в любой момент времени переходного 
процесса только одного “слабого звена” позволяет 
упростить синтез управлений. 

Оптимизация по быстродействию закона управления 
системой, у которой траектория движения не зависит от 
предыстории, а определяется только исходным состоя- 
нием, возможна на основе принципа, согласно которому 
любой конечный участок оптимальной траектории от 
любой промежуточной точки до конца является тоже 
оптимальной траекторией, если считать исходную 
промежуточную точку началом траектории. 

Разработана методика синтеза оптимальных управ- 
лений линейными и нелинейными системами. Опти- 
мальный закон управления составляется из управлений, 
найденных во время переходного процесса для малых 
интервалов времени. Расчет осуществляется с учетом 
ограничений фазовых координат, критерия оптималь- 
ности, конечного и начального состояния системы. 
Поиск оптимальных управлений на малых интервалах 
времени ведется последовательно с учетом значений 
координат системы, полученных при оптимальном 
управлении на предыдущих шагах. 

На первом этапе методом динамического програм- 
мирования с учетом принятых ограничений рассчиты- 
вают оптимальное управление для очередного шага. Это 
управление в дальнейшем может быть скорректировано 
после проведения проверок на отсутствие нарушений 
ограничений координат во время переходного процес- 
са. На втором этапе определяют координаты системы 
в результате выполнения пробного шага с найденным 
прогнозируемым оптимальным управлением. Расчеты 
ведутся последовательно от входа к выходу системы. 


На третьем этапе методом имитационного моделиро- 
вания выполняют перевод системы по оптимальному 
закону с учетом принятых ограничений из состояния, 
полученного в результате выполнения пробного шага, 
в равновесное состояние. Под равновесным состоянием 
понимается состояние системы, в котором она может 
оставаться длительное время без изменения координат. 
На четвертом этапе сравнивают значения координат 
системы при переводе ее по оптимальному закону в 
равновесное состояние с допустимыми значениями 
координат. Если нет нарушений принятых ограничений, 
то примененное на пробном шаге управление считается 
оптимальным, и его можно использовать для расчета 
реальных координат системы на очередном шаге. 

Если наблюдаются нарушения принятых ограниче- 
ний, то примененное на пробном шаге управление не 
является оптимальным, его следует скорректировать 
и повторить расчеты по описанному циклу, начиная 
с расчета координат системы после выполнения про- 
бного шага. Оптимальные управления на отдельных 
шагах интегрирования составляют в конечном итоге 
оптимальный закон управления системой. 

Перевод системы в равновесное состояние выпол- 
няется методом имитационного моделирования путем 
изменения в иерархической последовательности всех 
координат до установившихся значений. При изменении 
координат до установившихся значений по оптималь- 
ным законам могут формироваться различные цели, 
однако всегда используется принцип “ведущего слабого 
звена” и идет подстройка под самое “сильное” в данный 
момент ограничение. 

Сложность состоит в необходимости одновременно- 
го выхода на установившееся значение как анализируе- 
мой координаты, так и всех предшествующих координат. 
Задача усложняется с повышением порядка системы. 
Все расчеты выполняются по циклическим алгоритмам. 
Особенностью предложенной методики, в отличие от 
других методов решения многошаговых задач, является 
использование промежуточных критериев, позволяю- 
щих сразу отсечь заведомо неприемлемые управления 
[2] и тем самым сократить объем вычислений. 

В некоторых случаях удается получить простые ана- 
литические выражения для расчета процесса перевода 
объекта в установившиеся состояния после выполнения 
пробного шага, что открывает широкие перспективы по 
разработке алгоритмов синтеза в реальном масштабе 
времени микропроцессорными средствами оптималь- 
ных управлений объектами высоких порядков. 

2. Оптимальное управление линейным объектом 

Объект описывается системой уравнений 

л 

"аГ х >- 

I ас 
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где Х|, Х 2 , Х 3 - координаты системы, II - управляющее 
воздействие, і - время. 

Управляющее воздействие II и координата Х[ огра- 
ничены на уровнях ІІ М и Х м 

№)\ й Ум, 

№)\ - х м . 

Определим оптимальное управление 11(1), обеспечи- 
вающее минимальное время Т перевода объекта из ис- 
ходного состояния Х[(0)=0, Х 2 (0)=0, Х 3 (0)=0 в заданное 
состояние Х 1 (Т)=Х М , Х 2 (Т)=0, Х 3 (Т)=0. Решение задачи 
с помощью предложенной методики предполагает, 
что речь идет о системе с квантованием координат по 
уровню и по времени. При этом объект описывается 
системой разностных уравнений 


Д{ 

ЛХ ^ = Х. 


АХ 3 

ДІ 


=ѵ. 


дх„ дх„ дх, 

где 1 2 ’ 3 - ппшзащения координат системы 

за шаг интегрирования А1 • Управление 11(1) вычисляет- 
ся в виде последовательности значений ІІ 0 ,ІІ[, ... ІІ С . 

Для исходного состояния системы рассчитывается 
прогнозируемое оптимальное управление и определя- 
ются координаты системы в результате выполнения 
первого пробного шага. Затем выполняется перевод 
системы в равновесное состояние. Ставится задача из- 
менения координаты Х 2 с предельными возможностями 
до уровня Х 2 =0 (с одновременным выходом координаты 
Х 3 на уровень Х 3 =0). Для этого находится оптимальное 
управление и рассчитываются значения координат сис- 
темы в результате выполнения второго пробного шага. 
Затем по циклическому алгоритму решается задача 
изменения координаты Х 3 с предельными возможнос- 
тями до уровня Х 3(к) =0. Определяются координаты 
системы Х 1(к) и Х 2(к) при Х 3(к =0. Производится оценка 
значения координаты Х ад . Если оно не равно нулю, 
то рассчитывается еще один пробный шаг по скорей- 
шему достижению координатой Х 2 нулевого значения, 
причем, в качестве начальных условий используют 
координаты системы с предыдущего второго пробного 
шага. По циклическому алгоритму изменяется коор- 
дината Х 3 с предельными возможностями до нулевого 
значения, оценивается значение координаты Х 2 и далее 
по описанному циклу. Таким способом удается достичь 
значений Х 2(р) =0 и Х 3(р) =0, соответствующих равно- 
весному состоянию системы. Оценивается значение 
координаты Х 1( ). Если оно не превышает значения Х м , 
то использованное на первом пробном шаге управление 
считается оптимальным. В случае нарушения ограни- 
чения (Х 1(р) >Х м ) следует изменить прогнозируемое 
оптимальное управление на первом пробном шаге и 
повторить расчеты по описанному циклу, начиная с 
расчета координат системы после выполнения первого 
пробного шага. 

Определение оптимального управления для рас- 


сматриваемого объекта на (п+1) шаге выполняется в 
следующей последовательности. Начальное состояние 
объекта характеризуется координатами Х 1(п) , Х 2(п) , 
Х 3(п) . Методом динамического программирования 
рассчитывается управление, обеспечивающее макси- 
мальное приращение координаты Х[ на (п+1) шаге 
интегрирования. 

Определяется требуемое приращение по координате 


X, 


АХ,(„ + ,)-Х м < Х 1(п) , 


вычисляется значение координаты Х 2 , способное 


обеспечить это щ 


<п+1) 


ЛХ 1 (П+ 1 ) / До- 


определяется требуемое приращение по координате 


X, 


ду _ у 
ІІЛ 2(п+1) Л 2(п+1)-' і 2(п) 


А, 


и значение координаты Х 3 , способное обеспечить это 
приращение ѵ _ ЛѴ , л . 

Л 3(п+1) ЛЛ 2(П+1) ' 

Вычисляется требуемое приращение по координате 


X, 


— Хз( п+ і) Х 3(п) 


и обеспечивающее 


О 


(п+1) 


‘Дхэо.+о/лі. 


Это управление ограничивается, при необходимос- 
ти, на уровне ІІ М . Рассчитываются координаты объекта 
с найденным управлением после выполнения первого 
пробного шаг° (ѵ ѵ ѵ ) 

X _ Х +11 -АТ 

Л 31(п4 1) Л 3(п) ^ (п+ 1) 

Х 2 і(п+і) — Х 2(п ^ +Х 31(п+1 р Ді, 

Хц(п+і) х 1(а) +х 21(п+1) .ді. 


Они используются в качестве начальных условий 
для перевода объекта в равновесное состояние. 

Перевод объекта в равновесное состояние начинает- 
ся с расчета второго пробного шага (п+2), выполняемого 
с целью скорейшего достижения координатой Х 2 значе- 
ния Х 2 =0. В качестве начальных условий используются 
координаты системы Х 11(п+1) , Х 21(п+1) , Х 31(п+1) , получен- 
ные в результате расчета первого пробного шага. Расчет 
ведется методом динамического программирования, 
аналогично первому пробному шагу, только теперь 
изменена цель управления. По аналогичной методике 
определяются координаты системы в результате выпол- 
нения второго пробного шага Х 12(п+2) , Х 22(п+2) , Х 32(п+2) 
В качестве “ведущего слабого звена” вновь выступает 
ограниченное управление. 

Новые координаты объекта Х 32(п+2) , Х 22(п+2) , Х 12(п+2) 
используют в качестве начальных условий в цикличес- 
ком алгоритме, обеспечивающем изменение координаты 
Х 3 до значения Х 3 =0, соответствующего установивше- 
муся значению координаты Х 2 . Расчеты выполняют 
методом динамического программирования. 

После достижения координатой Х 3 значения 
Х 3 =0 оценивается значение координаты Х 2 . Если оно 
оказывается больше Х 2 (Т), то рассчитывается новый 
пробный шаг по скорейшему достижению координатой 
Х 2 значения Х 2 (Т), только в качестве начальных усло- 
вий используют координаты объекта Х 32(п+2) , Х 22(п+2) , 
Хщп+ 2 ), полученные в результате выполнения преды- 
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дущего второго пробного шага. Вновь используется 
циклический алгоритм, обеспечивающий изменение 
координаты Х 3 до значения Х 3 =0, и оценивается значе- 
ние координаты Х 2 . 

Расчеты по такому циклу продолжают до тех пор, 
пока координата Х 2 не достигнет значения Х 2 =0. Иногда 
для одновременного достижения координатами Х 2 и 
Х 3 значений Х 2 = 0 и Х 3 =0 приходится использовать 
метод последовательных приближений. Полученные 
значения Х 2 =0 и Х 3 =0 соответствуют установившемуся 
состоянию объекта. Оценивается значение координаты 
Х[. Если оно не превышает значение Х м , то найденное 
на первом пробном шаге управление 11 (п+1) считается 
оптимальным. В противном случае управление на (п+1) 
шаге определяется методом последовательных прибли- 
жений из диапазона (-И м ...+ІІ М ). Для последующих 
шагов синтез управления выполняется по аналогичной 
методике. 

Заключение 

Методика последовательного многошагового син- 
теза управлений позволяет определять оптимальные 
по быстродействию управления во время переходного 
процесса при наличии ограничений и нелинейностей 
путем суммирования управлений, получаемых для 
малых интервалов времени. Возможен синтез мик- 
ропроцессорными средствами в реальном масштабе 
времени оптимальных управлений высокоскоростными 
подвижными объектами, автоматизация сложных про- 
изводственных процессов, определение предельных ди- 


намических возможностей исполнительных устройств. 
Повышение порядка системы и числа ограничений не 
вызывает принципиальных трудностей. 
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